1000 resultados para Síntese : Fala


Relevância:

80.00% 80.00%

Publicador:

Resumo:

Sabe-se que a fala é a principal maneira de comunicação entre as pessoas. A Síntese de fala (geração automática da fala pelo computador) tem recebido atenção da comunidade acadêmica e profissional por várias décadas. Ela envolve a conversão de um texto de entrada em fala, usando algoritmos e algumas formas de fala codificada. O texto pode ser digitado pelo teclado ou obtido por reconhecimento de caracteres ou, ainda, obtido de um banco de dados. A síntese de fala pode ser usada em vários domínios de aplicação, tais como: auxílio para deficientes visuais, telecomunicações, multimídia, etc. Este trabalho apresenta um estudo sobre a produção da fala e da área de síntese de fala visando servir de subsídio para dissertações e pesquisas futuras, bem como para o Projeto Spoltech, um projeto de cooperação entre os Estados Unidos e o Brasil para o avanço da tecnologia da língua falada no Brasil (Português Brasileiro). Dentro deste estudo serão apresentadas as principais técnicas de síntese de fala, entre as quais destaca-se: Texto para Fala (TPF). Problemas de separação de sílabas, determinação da sílaba tônica, pronunciação das vogais “e” e “o” como um fonema aberto ou fechado, etc, são enfrentados dentro do contexto da área de síntese de fala para o português falado no Brasil. Tendo conhecimento destes problemas, o principal objetivo deste trabalho será criar regras para resolver o problema de pronunciação das vogais “e” e “o” de forma automática, visando obter produção sonora mais inteligível, por intermédio da implementação de um analisador estatístico, o qual verificará a letra anterior e posterior ao “e” ou “o” de uma palavra e, com isso, determinar a pronúncia dos mesmos para aquela seqüência de letras. As mesmas poderão tornar-se regras válidas para a solução do problema se atingirem 80% dos casos de ocorrência no dicionário com fonema “e” ou “o” aberto (limiar), sendo que elas serão lidas por um interpretador Scheme utilizado pelo programa Festival - ferramenta para a construção de sistemas de síntese de fala desenvolvida pelo Centre for Speech Technology Research (University of Edinburgh, Reino Unido), a qual utiliza TPF como método de síntese. Sabendo-se que o Festival gera os fonemas “e” e “o” como fechados se não há uma regra para inferir o contrário, serão consideradas apenas as regras encontradas para os fonemas abertos. Para possibilitar esta análise será utilizado um dicionário eletrônico de pronunciação (com 19.156 palavras), o qual possui a palavra e a sua respectiva pronúncia, conforme pode-se verificar no exemplo do Anexo 1.

Relevância:

80.00% 80.00%

Publicador:

Resumo:

Este trabalho descreve a aplicação da Programação Genética, uma técnica de Computação Evolucionária, ao problema da Síntese de Fala automática. A Programação Genética utiliza as técnicas da evolução humana para descobrir programas bem adaptados a um problema específico. Estes programas, compostos de instruções, variáveis, constantes e outros elementos que compõe uma linguagem de programação, são evoluídos ao longo de um conjunto de gerações. A Síntese de Fala, consiste na geração automática das formas de ondas sonoras a partir de um texto escrito. Uma das atividades mais importantes, é realizada através da conversão de palavras e letras para os sons da fala elementares (fonemas). Muitos sistemas de síntese são implementados através de regras fixas, escritas por programadores humanos. Um dos mais conhecidos sistemas de síntese é o FESTIVAL, desenvolvido pela Universidade de Edimburgh, usando a linguagem de programação funcional LISP e um número fixo de regras. Neste trabalho, nós exploramos a possibilidade da aplicação do paradigma da Programação Genética, para evoluir automaticamente regras que serão adotadas para implementação do idioma Português na ferramenta FESTIVAL, desenvolvido no projeto SPOLTECH (CNPq – NSF cooperação entre UFRGS e Universidade do Colorado). A modelagem do problema, consiste na definição das regras de pronúncia do Português Brasileiro, que a implementação do sistema FESTIVAL pronuncia erradamente, já que o mesmo foi implementado primariamente para o idioma Inglês. A partir destas regras, o sistema de Programação Genética, desenvolvido neste trabalho, evolui programas que constituem boas soluções para a conversão de letras para fonemas. A descrição dos resultados obtidos, cobre detalhes sobre a evolução das soluções, complexidade e regras implementadas, representadas pelas soluções mais bem adaptadas; mostrando que a Programação Genética, apesar de ser complexa, é bastante promissora.

Relevância:

30.00% 30.00%

Publicador:

Resumo:

Motivados pelo propósito central de contribuir para a construção, a longo prazo, de um sistema completo de conversão de texto para fala, baseado em síntese articulatória, desenvolvemos um modelo linguístico para o português europeu (PE), com base no sistema TADA (TAsk Dynamic Application), que visou a obtenção automática da trajectória dos articuladores a partir do texto de entrada. A concretização deste objectivo ditou o desenvolvimento de um conjunto de tarefas, nomeadamente 1) a implementação e avaliação de dois sistemas de silabificação automática e de transcrição fonética, tendo em vista a transformação do texto de entrada num formato adequado ao TADA; 2) a criação de um dicionário gestual para os sons do PE, de modo a que cada fone obtido à saída do conversor grafema-fone pudesse ter correspondência com um conjunto de gestos articulatórios adaptados para o PE; 3) a análise do fenómeno da nasalidade à luz dos princípios dinâmicos da Fonologia Articulatória (FA), com base num estudo articulatório e perceptivo. Os dois algoritmos de silabificação automática implementados e testados fizeram apelo a conhecimentos de natureza fonológica sobre a estrutura da sílaba, sendo o primeiro baseado em transdutores de estados finitos e o segundo uma implementação fiel das propostas de Mateus & d'Andrade (2000). O desempenho destes algoritmos – sobretudo do segundo – mostrou-se similar ao de outros sistemas com as mesmas potencialidades. Quanto à conversão grafema-fone, seguimos uma metodologia baseada em regras de reescrita combinada com uma técnica de aprendizagem automática. Os resultados da avaliação deste sistema motivaram a exploração posterior de outros métodos automáticos, procurando também avaliar o impacto da integração de informação silábica nos sistemas. A descrição dinâmica dos sons do PE, ancorada nos princípios teóricos e metodológicos da FA, baseou-se essencialmente na análise de dados de ressonância magnética, a partir dos quais foram realizadas todas as medições, com vista à obtenção de parâmetros articulatórios quantitativos. Foi tentada uma primeira validação das várias configurações gestuais propostas, através de um pequeno teste perceptual, que permitiu identificar os principais problemas subjacentes à proposta gestual. Este trabalho propiciou, pela primeira vez para o PE, o desenvolvimento de um primeiro sistema de conversão de texto para fala, de base articulatória. A descrição dinâmica das vogais nasais contou, quer com os dados de ressonância magnética, para caracterização dos gestos orais, quer com os dados obtidos através de articulografia electromagnética (EMA), para estudo da dinâmica do velo e da sua relação com os restantes articuladores. Para além disso, foi efectuado um teste perceptivo, usando o TADA e o SAPWindows, para avaliar a sensibilidade dos ouvintes portugueses às variações na altura do velo e alterações na coordenação intergestual. Este estudo serviu de base a uma interpretação abstracta (em termos gestuais) das vogais nasais do PE e permitiu também esclarecer aspectos cruciais relacionados com a sua produção e percepção.

Relevância:

30.00% 30.00%

Publicador:

Resumo:

Estudar os mecanismos subjacentes à produção de fala é uma tarefa complexa e exigente, requerendo a obtenção de dados mediante a utilização de variadas técnicas, onde se incluem algumas modalidades imagiológicas. De entre estas, a Ressonância Magnética (RM) tem ganho algum destaque, nos últimos anos, posicionando-se como uma das mais promissoras no domínio da produção de fala. Um importante contributo deste trabalho prende-se com a otimização e implementação de protocolos (RM) e proposta de estratégias de processamento de imagem ajustados aos requisitos da produção de fala, em geral, e às especificidades dos diferentes sons. Para além disso, motivados pela escassez de dados para o Português Europeu (PE), constitui-se como objetivo a obtenção de dados articulatórios que permitam complementar informação já existente e clarificar algumas questões relativas à produção dos sons do PE (nomeadamente, consoantes laterais e vogais nasais). Assim, para as consoantes laterais foram obtidas imagens RM (2D e 3D), através de produções sustidas, com recurso a uma sequência Eco de Gradiente (EG) rápida (3D VIBE), no plano sagital, englobando todo o trato vocal. O corpus, adquirido por sete falantes, contemplou diferentes posições silábicas e contextos vocálicos. Para as vogais nasais, foram adquiridas, em três falantes, imagens em tempo real com uma sequência EG - Spoiled (TurboFLASH), nos planos sagital e coronal, obtendo-se uma resolução temporal de 72 ms (14 frames/s). Foi efetuada aquisição sincronizada das imagens com o sinal acústico mediante utilização de um microfone ótico. Para o processamento e análise de imagem foram utilizados vários algoritmos semiautomáticos. O tratamento e análise dos dados permitiu efetuar uma descrição articulatória das consoantes laterais, ancorada em dados qualitativos (e.g., visualizações 3D, comparação de contornos) e quantitativos que incluem áreas, funções de área do trato vocal, extensão e área das passagens laterais, avaliação de efeitos contextuais e posicionais, etc. No que respeita à velarização da lateral alveolar /l/, os resultados apontam para um /l/ velarizado independentemente da sua posição silábica. Relativamente ao /L/, em relação ao qual a informação disponível era escassa, foi possível verificar que a sua articulação é bastante mais anteriorizada do que tradicionalmente descrito e também mais extensa do que a da lateral alveolar. A resolução temporal de 72 ms conseguida com as aquisições de RM em tempo real, revelou-se adequada para o estudo das características dinâmicas das vogais nasais, nomeadamente, aspetos como a duração do gesto velar, gesto oral, coordenação entre gestos, etc. complementando e corroborando resultados, já existentes para o PE, obtidos com recurso a outras técnicas instrumentais. Para além disso, foram obtidos novos dados de produção relevantes para melhor compreensão da nasalidade (variação área nasal/oral no tempo, proporção nasal/oral). Neste estudo, fica patente a versatilidade e potencial da RM para o estudo da produção de fala, com contributos claros e importantes para um melhor conhecimento da articulação do Português, para a evolução de modelos de síntese de voz, de base articulatória, e para aplicação futura em áreas mais clínicas (e.g., perturbações da fala).

Relevância:

30.00% 30.00%

Publicador:

Resumo:

Sistema Texto-Fala (TTS) é atualmente uma tecnologia madura que é utilizada em muitas aplicações. Alguns módulos de um sistema TTS são dependentes do idioma e, enquanto existem muitos recursos disponíveis para a língua inglesa, os recursos para alguns idiomas ainda são limitados. Este trabalho descreve o desenvolvimento de um sistema TTS completo para português brasileiro (PB), o qual também apresenta os recursos já disponíveis. O sistema usa a plataforma MARY e o processo de síntese da voz é baseado em cadeias escondidas de Markov (HMM). Algumas das contribuições deste trabalho consistem na implementação de silabação, determinação da sílaba tônica e conversão grafema-fonema (G2P). O trabalho também descreve as etapas para a organização dos recursos desenvolvidos e a criação de uma voz em PB junto ao MARY. Estes recursos estão disponíveis e facilita a pesquisa na normalização de texto e síntese baseada em HMM par o PB.

Relevância:

30.00% 30.00%

Publicador:

Resumo:

A fala é um mecanismo natural para a interação homem-máquina. A tecnologia de processamento de fala (ou voz) encontra-se bastante avançada e, em escala mundial, existe vasta disponibilidade de software, tanto comercial quanto acadêmico. a maioria assume a disponibilidade de um reconhecedor e/ou sintetizador, que pode ser programado via API. Ao contrário do que ocorre, por exemplo, na língua inglesa, inexiste atualmente uma gama variada de recursos para o português brasileiro. O presente trabalho discute alguns esforços realizados nesse sentido, avaliando a utilização da SAPI E JSAPI, que são as APIs da Microsoft e Sun, respectivamente. Serão apresentados, outrossim, exemplos de aplicativos: uma aplicação CALL (baseada em SAPI) usando síntese em inglês e português, reconhecimento em inglês e agentes visuais; e uma proposta para agregar reconhecimento e síntese de voz ao chat IRC através de APIs Java.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

Síntese histórica dos grandes momentos da Câmara dos Deputados, das Assembléias Nacionais Constituintes e do Congresso Nacional.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

Análise linguístico-discursiva dos atos de fala presentes nas manifestações dos Parlamentares, especialmente no período da sessão denominado Ordem do Dia, incluídas aí as trocas conversacionais. Apresenta como base teórica a Linguística Sistêmico-Funcional, de Halliday – especificamente o Sistema de Troca da Linguagem –, a teoria dialógica de Bakhtin e o sistema estrutural conversacional proposto por Martin e Rose.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

Consultoria Legislativa - Área XVIII - Direito Internacional Público e Relações Internacionais.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

Apresenta uma síntese de indicadores e metas da saúde do Plano Plurianual (PPA) do período de 2012 a 2015. Os dados utilizado foram obtidos da avaliação realizada pelo Ministério do Planejamento, Orçamento e Gestão (MPOG)1, tomando como base os dados do ano de 2014.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

Sintetiza os procedimentos levados a efeito no âmbito da Câmara dos Deputados e do Senado Federal, quando do processo de Impeachment contra o Presidente Fernando Collor de Mello, em 1992.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

Neste trabalho, dois copolímeros à base de 2-vinilpiridina (2Vpy), estireno (Sty) e divinilbenzeno (DVB) foram sintetizados empregando a técnica de polimerização em suspensão aquosa via radical livre. Os copolímeros com diferentes características morfológicas foram preparados variando a composição da mistura diluente, constituída por tolueno e n-heptano, solventes solvatantes e não solvatantes para as cadeias poliméricas. A caracterização estrutural desses materiais foi feita através de medidas de área específica, volume de poros, diâmetro médio de poros e densidade aparente. Além disso, esses materiais foram avaliados por microscopia ótica e eletrônica de varredura, por espectroscopia na região do infravermelho (FTIR), análise termogravimétrica (TGA) e análise elementar. Os copolímeros Sty-DVB-2Vpy foram modificados quimicamente através de reação de quaternização das unidades de 2Vpy usando dois reagentes: iodeto de metila e acrilonitrila. A quaternização dos copolímeros Sty-DVB-2Vpy foi confirmada através de espectroscopia de infravermelho, pelo aparecimento das bandas de absorção características do íon peridíneo e do grupo nitrila e também pela análise do comportamento térmico. Os produtos dessas reações foram submetidos à avaliação da capacidade bactericida através do método de contagem em placas contra suspensão de Escherichia coli. O copolímero do tipo gel quaternizado com iodeto de metila apresentou a maior ação bactericida registrada, com eficiência até a concentração de 104 células/mL. Contudo, a maioria dos materiais quaternizados não apresentou ação biocida significativa. Com o objetivo de maximizar a atividade bactericida dos materiais preparados, os copolímeros quaternizados e não quaternizados foram impregnados com iodo por meio de duas metodologias: em solução e em fase vapor. O teor de iodo incorporado foi quantificado por análise gravimétrica. Foi possível observar que os copolímeros quaternizados e impregnados com iodo se mostraram mais eficientes como agentes bactericidas que os copolímeros não funcionalizados impregnados com iodo. De uma forma geral, foi possível perceber que a ação bactericida dos polímeros é fruto da associação entre as suas características de porosidade, o grau de quaternização alcançado e o teor de iodo incorporado. Para efeito de comparação foram feitos também ensaios bactericidas com uma resina comercial à base de Sty-DVB com grupo amônio quaternário, VP OC 1950. Os testes mostraram que a resina comercial não possui atividade bactericida. A impregnação de iodo a essa resina comercial forneceu um material com ação biocida semelhante à do copolímero do tipo gel, quaternizado com iodeto de metila e impregnado com iodo

Relevância:

20.00% 20.00%

Publicador:

Resumo:

Atualmente, a irradiação por micro-ondas tem se mostrado uma boa fonte de energia para a realização de sínteses orgânicas, devido a uma série de vantagens que essa nova tecnologia apresenta. Entretanto, ainda existem poucos estudos sobre polimerizações assistidas por micro-ondas. Neste trabalho foram realizadas a síntese da 2-fenil-2-oxazolina e a sua polimerização, em solução e em massa, assistidas por micro-ondas e pelo método convencional (térmico). As reações irradiadas por micro-ondas foram feitas empregando-se vaso aberto ou fechado, e nas polimerizações foram usados como iniciadores o iodeto de metila e o eterado de trifluoreto de boro. Os heterocíclicos e os polímeros produzidos foram caracterizados por espectroscopia na região do infravermelho e ressonância magnética nuclear de núcleo de hidrogênio. Para as reações assistidas por micro-ondas os rendimentos foram bons e compatíveis com os obtidos pelo método convencional. Para a reação de síntese da 2-fenil-2-oxazolina o rendimento ficou na faixa de 70% e de suas polimerizações em torno de 80%, sendo as reações irradiadas por micro-ondas realizadas em um tempo reacional muito inferior ao do método térmico. A técnica de irradiação de micro-ondas para as reações estudadas se mostrou eficiente para os parâmetros utilizados na síntese do monômero e na sua polimerização em massa.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

Considerações ambientais têm aumentado a pesquisa e o desenvolvimento de sistemas poliméricos aquosos para diversos tipos de aplicações, principalmente como revestimentos. Nesta dissertação, foram sintetizadas formulações não-poluentes à base de poliuretanos dispersos em água (PUDs), com 40% de teor de sólidos, na ausência de solventes orgânicos. Os monômeros empregados foram copolímeros em bloco à base de poli(glicol etilênico) e poli(glicol propilênico) (EG-b-PG), com teor de 25% de segmento hidrofílico EG, poli (glicol propilênico) (PPG), ácido dimetilolpropiônico (DMPA), diisocianato de isoforona (IPDI) e hidrazina (HYD), como extensor de cadeia. Foram variadas as razões entre o número de equivalente-grama de grupamentos isocianato e hidroxila (NCO/OH) e a proporção em equivalente-grama de PPG e dos copolímeros em bloco (EG-b-PG). Foi observado que a incorporação de altas quantidades de copolímero dificultou a síntese dos poliuretanos dispersos em água, levando à formação de géis. O tamanho médio de partícula e a viscosidade das dispersões foram determinados. Os filmes vazados a partir dessas dispersões foram avaliados quanto à capacidade de absorção de água, resistência mecânica, termogravimetria (TG), e caracterizados por espectroscopia na região do infravermelho (FTIR). As dispersões poliuretânicas produzidas se mostraram satisfatórias quando aplicadas como revestimento para madeira, metais e vidro